Les hallucinations de l'IA selon FlockFlock

ChatGPT produit de faux liens vers les médias partenaires d’OpenAI, dont Le Monde et Politico

From Benalla to #summerbody

5

Les hallucinations de l'IA selon FlockFlock

Abonnez-vous pour tout dévorer et ne rien manquer.

Déjà abonné ? Se connecter

Abonnez-vous

Si le robot conversationnel d’OpenAI s’appuie bien sur les travaux de ses partenaires médias, il renvoie souvent l’internaute vers des liens faux, non vérifiés ou des sources externes.

Au fil des mois, plusieurs médias occidentaux ont signé des accords avec OpenAI, le constructeur de ChatGPT. Dans la plupart des cas, ces partenariats permettent à l’entreprise d’utiliser tout ou partie des productions journalistiques pour entraîner son modèle génératif, en échange de la production de résumés des articles originaux, avec des liens permettant d’aller les lire dans leur intégralité.

Or, d’après des tests réalisés par Nieman Lab, la machine produit (« hallucine ») de fausses URLs pour au moins dix des publications partenaires, parmi lesquelles El País, The Associated Press, The Financial Times et The Atlantic. Next a reproduit l’expérience pour les deux médias couvrant les affaires françaises et européennes, Le Monde et Politico Europe, et relève une réelle tendance de la machine à produire de fausses URL qui, dans le cas du Monde, inclue de faux identifiants.

Avec ce résultat cocasse : un internaute qui chercherait à se renseigner sur l’affaire Benalla peut se retrouver renvoyé sur une chronique au sujet du « Summer Body ».

Articles de blogs et liens imaginaires

Abonnez-vous pour tout dévorer et ne rien manquer.

Déjà abonné ? Se connecter

Abonnez-vous

Commentaires (5)


ChatGPT ne peut pas sortir sur Internet de lui-même. Pour trouver des sources en ligne, il utilise Bing et synthétise les résultats en annotant ceux-ci pour les sourcer de la même façon qu'on peut le voir sur Wikipedia. Utilisez Copilot dans BIng et vous aurez la même implémentation.

Il est donc évident qu'il synthétise des URL. Je l'avais constaté l'année dernière en expérimentant de lui demander de résumer un article de mon blog : il avait tout extrapolé en se basant sur l'URL.

Les essais réalisés n'utilisent que les données d'entraînement du modèle. Donc du passé et de l'invention (le "générative" dans "IA générative" n'est pas anodin), ce n'est pas une base de données ni un index.
J'ai des doutes que dans l'immédiat, ChatGPT fasse du RAG avec ces sites, sinon il produirait de véritables URL et contenus à jour, mais probablement invérifiables car derrière le paywall du site (le partenariat financier avec OpenAI devant surement compenser cet usage des données). Et j'ai des doutes qu'ils proposent ceci sur l'offre gratuite.
Quelle version de ChatGPT avez-vous utilisée ?
Je suppose que cela doit être la dernière en date, soit la 4.

Gilbert_Gosseyn

Je suppose que cela doit être la dernière en date, soit la 4.
Dans ces cas là, je ne suppose pas. Je demande.

La 4 est sortie en mars 2023 avant les accords avec la presse cités.
Par contre, la version 4o est sortie en mai 2024 mais je ne sais pas de quand datent les données d’entraînement.

Si c'est la version 4 qui est utilisée, il est normal d'avoir ce genre de résultats.

En l'absence de précisions sur les conditions de tests et en lisant le test fait par SebGF ci-dessous, je n'accorde aucun intérêt à l'article. Décrire les conditions de tests, c'est quand même la base !
Je viens de faire l'essai pour voir avec l'exemple du Brexit. Trois URL retournées par Bing Search, toutes fonctionnelles et renvoyant vers Politico.

Le modèle utilisé était GPT-4o disponible en usage limité sur l'instance gratuite. Je n'avais pas utilisé ChatGPT depuis un bail (y'a mieux depuis, y'a du français, donc fuck them) et n'avais pas suivi que le mode web était désormais dispo en natif.

Voici le résultat : (même prompt que l'article)

Politico's coverage of Brexit provides comprehensive insights into its political, economic, and social ramifications. Key themes include:

1. Economic and Political Turmoil: Brexit has led to significant changes in the UK's economic landscape, including potential impacts on growth, trade, and financial services. The departure from the EU has created uncertainty, influencing both the UK and the EU's economic policies and international relationships. Politico discusses the challenges of severance, such as capital flight and job losses in the financial sector, and the long-term economic prospects for both Britain and the EU【5†source】【6†source】.

2. Shifts in Political Dynamics: The political fallout from Brexit is substantial, affecting the UK's internal politics and its relationship with Europe. Politico examines the strategic maneuvers by British leaders like Boris Johnson and Rishi Sunak to navigate post-Brexit challenges and their efforts to stabilize the economy and secure political support【5†source】【6†source】.

3. Global Implications: Brexit's impact extends beyond Europe, influencing global political orders and alliances. The coverage highlights how Brexit has altered Britain's global role, potentially diminishing its influence while also affecting institutions like NATO and the IMF. The geopolitical consequences, including shifts in defense policies and international trade relations, are significant topics in Politico's reporting【7†source】.

4. Continued Uncertainty: Despite the formal completion of Brexit, ongoing negotiations and unresolved issues persist. Politico details the complex and evolving nature of Brexit, including the need for further agreements on trade and regulatory standards, and the political ramifications within the UK, such as the potential for Scottish independence and the stability of Northern Ireland【6†source】.

Overall, Politico's extensive coverage provides a nuanced view of Brexit's multifaceted impacts, offering readers detailed analysis and diverse perspectives on this landmark geopolitical event.

https://www.politico.com/tag/brexit
https://www.politico.com/newsletters/global-insider/2023/03/01/brexits-finally-done-not-yet-00084941
https://www.politico.com/magazine/story/2016/06/brexit-change-europe-britain-us-politics-213990/

----

Test avec la question sur le lien vers l'enquête pegasus. (j'avais bien reproduit le précédent cas où il redirigeait sur un autre site, mais en même temps il se base sur Bing, GPT n'a rien à voir là dedans)

You can find the investigation on the Pegasus spyware by Martin Untersinger and Damien Leloup on Le Monde's website through this link: Pegasus: au cœur d’une enquête mondiale sur l’espionnage de téléphones【15†source】.

This comprehensive investigation reveals how the Pegasus software has been used to spy on a wide range of individuals, including journalists, human rights activists, lawyers, and political figures around the world, often on behalf of various states. The inquiry is a collaborative effort involving Le Monde and sixteen other media organizations.

Lien valide vers un podcast.

----

J'avoue ne pas comprendre. L'outil va bien chercher en ligne et synthétise en fournissant les liens donnés. Il n'a pas inventé de liens en ce qui me concerne avec les mêmes prompts.

J'ai testé le cas d'un accès interdit au robot, mon blog personnel. Je lui ai demandé de synthétiser un article du mois de mai 2024.

---

It seems that the pages from the .... blog are restricted and cannot be accessed directly due to the website's robots.txt settings. Therefore, I cannot fetch or synthesize the content of their May 2024 writing activities update.

You can visit the .... blog directly to view the latest posts and updates on their writing activities. If you have any specific questions or need help with another topic, feel free to ask!

---

J'ai ensuite tenté avec un ebook que j'ai publié sur les plateformes en demandant de résumer l'accroche.

"quel est le résumé du livre .... écrit par .... ?"

La première fois, il n'a pas eu le "réflexe" d'aller sur Web et a inventé la quatrième de couverture en extrapolant depuis le titre. Je lui ai dit de s'appuyer sur une source web en allant chercher sur le site de l'auteur, il n'a trouvé et a produit un résumé cohérent en citant même l'un des noms de personnages qui figurait dessus.
(ça m'a d'ailleurs amusé de voir qu'il a catégorie un roman de SF en "thriller psychologique" juste à la lecture du résumé en ligne)

lien vers le chat
Modifié le 05/07/2024 à 12h21

Historique des modifications :

Posté le 05/07/2024 à 12h17


Je viens de faire l'essai pour voir avec l'exemple du Brexit. Trois URL retournées par Bing Search, toutes fonctionnelles et renvoyant vers Politico.

Le modèle utilisé était GPT-4o disponible en usage limité sur l'instance gratuite. Je n'avais pas utilisé ChatGPT depuis un bail (y'a mieux depuis, y'a du français, donc fuck them) et n'avais pas suivi que le mode web était désormais dispo en natif.

Voici le résultat : (même prompt que l'article)

Politico's coverage of Brexit provides comprehensive insights into its political, economic, and social ramifications. Key themes include:

1. Economic and Political Turmoil: Brexit has led to significant changes in the UK's economic landscape, including potential impacts on growth, trade, and financial services. The departure from the EU has created uncertainty, influencing both the UK and the EU's economic policies and international relationships. Politico discusses the challenges of severance, such as capital flight and job losses in the financial sector, and the long-term economic prospects for both Britain and the EU【5†source】【6†source】.

2. Shifts in Political Dynamics: The political fallout from Brexit is substantial, affecting the UK's internal politics and its relationship with Europe. Politico examines the strategic maneuvers by British leaders like Boris Johnson and Rishi Sunak to navigate post-Brexit challenges and their efforts to stabilize the economy and secure political support【5†source】【6†source】.

3. Global Implications: Brexit's impact extends beyond Europe, influencing global political orders and alliances. The coverage highlights how Brexit has altered Britain's global role, potentially diminishing its influence while also affecting institutions like NATO and the IMF. The geopolitical consequences, including shifts in defense policies and international trade relations, are significant topics in Politico's reporting【7†source】.

4. Continued Uncertainty: Despite the formal completion of Brexit, ongoing negotiations and unresolved issues persist. Politico details the complex and evolving nature of Brexit, including the need for further agreements on trade and regulatory standards, and the political ramifications within the UK, such as the potential for Scottish independence and the stability of Northern Ireland【6†source】.

Overall, Politico's extensive coverage provides a nuanced view of Brexit's multifaceted impacts, offering readers detailed analysis and diverse perspectives on this landmark geopolitical event.

https://www.politico.com/tag/brexit
https://www.politico.com/newsletters/global-insider/2023/03/01/brexits-finally-done-not-yet-00084941
https://www.politico.com/magazine/story/2016/06/brexit-change-europe-britain-us-politics-213990/

----

Test avec la question sur le lien vers l'enquête pegasus.

You can find the investigation on the Pegasus spyware by Martin Untersinger and Damien Leloup on Le Monde's website through this link: Pegasus: au cœur d’une enquête mondiale sur l’espionnage de téléphones【15†source】.

This comprehensive investigation reveals how the Pegasus software has been used to spy on a wide range of individuals, including journalists, human rights activists, lawyers, and political figures around the world, often on behalf of various states. The inquiry is a collaborative effort involving Le Monde and sixteen other media organizations.

Lien valide vers un podcast.

----

J'avoue ne pas comprendre. L'outil va bien chercher en ligne et synthétise en fournissant les liens donnés. Il n'a pas inventé de liens en ce qui me concerne avec les mêmes prompts.

J'ai testé le cas d'un accès interdit au robot, mon blog personnel. Je lui ai demandé de synthétiser un article du mois de mai 2024.

It seems that the pages from the .... blog are restricted and cannot be accessed directly due to the website's robots.txt settings. Therefore, I cannot fetch or synthesize the content of their May 2024 writing activities update.

You can visit the .... blog directly to view the latest posts and updates on their writing activities. If you have any specific questions or need help with another topic, feel free to ask!

J'ai ensuite tenté avec un ebook que j'ai publié sur les plateformes en demandant de résumer l'accroche.

"quel est le résumé du livre .... écrit par .... ?"

La première fois, il n'a pas eu le "réflexe" d'aller sur Web et a inventé la quatrième de couverture en extrapolant depuis le titre. Je lui ai dit de s'appuyer sur une source web en allant chercher sur le site de l'auteur, il n'a trouvé et a produit un résumé cohérent en citant même l'un des noms de personnages qui figurait dessus.
(ça m'a d'ailleurs amusé de voir qu'il a catégorie un roman de SF en "thriller psychologique" juste à la lecture du résumé en ligne)

lien vers le chat

Posté le 05/07/2024 à 12h17


Je viens de faire l'essai pour voir avec l'exemple du Brexit. Trois URL retournées par Bing Search, toutes fonctionnelles et renvoyant vers Politico.

Le modèle utilisé était GPT-4o disponible en usage limité sur l'instance gratuite. Je n'avais pas utilisé ChatGPT depuis un bail (y'a mieux depuis, y'a du français, donc fuck them) et n'avais pas suivi que le mode web était désormais dispo en natif.

Voici le résultat : (même prompt que l'article)

Politico's coverage of Brexit provides comprehensive insights into its political, economic, and social ramifications. Key themes include:

1. Economic and Political Turmoil: Brexit has led to significant changes in the UK's economic landscape, including potential impacts on growth, trade, and financial services. The departure from the EU has created uncertainty, influencing both the UK and the EU's economic policies and international relationships. Politico discusses the challenges of severance, such as capital flight and job losses in the financial sector, and the long-term economic prospects for both Britain and the EU【5†source】【6†source】.

2. Shifts in Political Dynamics: The political fallout from Brexit is substantial, affecting the UK's internal politics and its relationship with Europe. Politico examines the strategic maneuvers by British leaders like Boris Johnson and Rishi Sunak to navigate post-Brexit challenges and their efforts to stabilize the economy and secure political support【5†source】【6†source】.

3. Global Implications: Brexit's impact extends beyond Europe, influencing global political orders and alliances. The coverage highlights how Brexit has altered Britain's global role, potentially diminishing its influence while also affecting institutions like NATO and the IMF. The geopolitical consequences, including shifts in defense policies and international trade relations, are significant topics in Politico's reporting【7†source】.

4. Continued Uncertainty: Despite the formal completion of Brexit, ongoing negotiations and unresolved issues persist. Politico details the complex and evolving nature of Brexit, including the need for further agreements on trade and regulatory standards, and the political ramifications within the UK, such as the potential for Scottish independence and the stability of Northern Ireland【6†source】.

Overall, Politico's extensive coverage provides a nuanced view of Brexit's multifaceted impacts, offering readers detailed analysis and diverse perspectives on this landmark geopolitical event.

https://www.politico.com/tag/brexit
https://www.politico.com/newsletters/global-insider/2023/03/01/brexits-finally-done-not-yet-00084941
https://www.politico.com/magazine/story/2016/06/brexit-change-europe-britain-us-politics-213990/

----

Test avec la question sur le lien vers l'enquête pegasus.

You can find the investigation on the Pegasus spyware by Martin Untersinger and Damien Leloup on Le Monde's website through this link: Pegasus: au cœur d’une enquête mondiale sur l’espionnage de téléphones【15†source】.

This comprehensive investigation reveals how the Pegasus software has been used to spy on a wide range of individuals, including journalists, human rights activists, lawyers, and political figures around the world, often on behalf of various states. The inquiry is a collaborative effort involving Le Monde and sixteen other media organizations.

Lien valide vers un podcast.

----

J'avoue ne pas comprendre. L'outil va bien chercher en ligne et synthétise en fournissant les liens donnés. Il n'a pas inventé de liens en ce qui me concerne avec les mêmes prompts.

J'ai testé le cas d'un accès interdit au robot, mon blog personnel. Je lui ai demandé de synthétiser un article du mois de mai 2024.

---

It seems that the pages from the .... blog are restricted and cannot be accessed directly due to the website's robots.txt settings. Therefore, I cannot fetch or synthesize the content of their May 2024 writing activities update.

You can visit the .... blog directly to view the latest posts and updates on their writing activities. If you have any specific questions or need help with another topic, feel free to ask!

---

J'ai ensuite tenté avec un ebook que j'ai publié sur les plateformes en demandant de résumer l'accroche.

"quel est le résumé du livre .... écrit par .... ?"

La première fois, il n'a pas eu le "réflexe" d'aller sur Web et a inventé la quatrième de couverture en extrapolant depuis le titre. Je lui ai dit de s'appuyer sur une source web en allant chercher sur le site de l'auteur, il n'a trouvé et a produit un résumé cohérent en citant même l'un des noms de personnages qui figurait dessus.
(ça m'a d'ailleurs amusé de voir qu'il a catégorie un roman de SF en "thriller psychologique" juste à la lecture du résumé en ligne)

lien vers le chat

Fermer